//package Test.情感分析;
//
//import weka.core.Attribute;
//import weka.core.FastVector;
//import weka.core.Instance;
//import weka.core.Instances;
//import weka.core.tokenizers.WordTokenizer;
//import weka.filters.unsupervised.attribute.StringToWordVector;
//
//import java.util.List;
//
//public class FeatureExtractor {
//    public static Instances extractFeatures(List<String> texts, List<String> labels) throws Exception {
//        // 定义属性
//        FastVector attributes = new FastVector();
//        attributes.addElement(new Attribute("text", (FastVector) null)); // 文本属性
//        FastVector classValues = new FastVector();
//        classValues.addElement("positive");
//        classValues.addElement("neutral");
//        classValues.addElement("negative");
//        attributes.addElement(new Attribute("class", classValues)); // 类别属性
//
//        // 创建数据集
//        Instances data = new Instances("text_data", attributes, texts.size());
//        data.setClassIndex(data.numAttributes() - 1); // 设置类别索引
//
//        // 添加数据
//        for (int i = 0; i < texts.size(); i++) {
//            Instance instance = new Instance(2);
//            instance.setValue(0, texts.get(i)); // 设置文本
//            instance.setValue(1, labels.get(i)); // 设置类别
//            data.add(instance);
//        }
//
//        // 使用StringToWordVector将文本转换为特征向量
//        StringToWordVector filter = new StringToWordVector();
//        filter.setTokenizer(new WordTokenizer());
//        filter.setInputFormat(data);
//        return weka.filters.Filter.useFilter(data, filter);
//    }
//}